Đặc tính của phân phối chuẩn Phân phối chuẩn

Có nhiều cách để thể hiện các đặc tính của một phân phối xác suất. Cách dễ thấy nhất là thông qua hàm mật độ xác suất (vẽ ở hình đầu tiên), nó cho biết khả năng xảy ra của mỗi giá trị của biến ngẫu nhiên. Hàm phân phối tích lũy cũng cho cùng thông tin, nhưng hình ảnh của nó thì thông tin chứa đựng không được dễ nhận thấy cho lắm (hình đi sau). Cách tương đương khi chỉ định một phân phối chuẩn là thông qua: mômen, ước lượng, hàm đặc trưng, hàm khởi tạo mômen, và hàm khởi tạo ước lượngđịnh lý Maxwell. Một số rất hữu ích về mặt lý thuyết, nhưng không trực quan. Xem phân phối xác suất.

Mọi ước lượng của phân phối chuẩn đều bằng 0, ngoại trừ hai cái đầu tiên.

Hàm mật độ xác suất

Hàm mật độ xác suất của 4 tập tham số khác nhau (đường đỏ là phân phối chuẩn tắcf)

Hàm mật độ xác suất của phân phối chuẩn với trung bình μ {\displaystyle \mu } và phương sai σ 2 {\displaystyle \sigma ^{2}} (hay, độ lệch chuẩn σ {\displaystyle \sigma } ) là một ví dụ của một hàm Gauss,

f ( x ; μ , σ ) = 1 σ 2 π exp ⁡ ( − ( x − μ ) 2 2 σ 2 ) . {\displaystyle f(x;\mu ,\sigma )={\frac {1}{\sigma {\sqrt {2\pi }}}}\,\exp \left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right).}

(Xem thêm hàm lũy thừapi.)

Nếu một biến ngẫu nhiên X {\displaystyle X} có phân phối này, ta ký hiệu là X {\displaystyle X} ~ N ( μ , σ 2 ) {\displaystyle N(\mu ,\sigma ^{2})} .Nếu μ = 0 {\displaystyle \mu =0} và σ = 1 {\displaystyle \sigma =1} , phân phối được gọi là phân phối chuẩn tắc và hàm mật độ xác suất rút gọn thành

f ( x ) = 1 2 π exp ⁡ ( − x 2 2 ) . {\displaystyle f(x)={\frac {1}{\sqrt {2\pi }}}\,\exp \left(-{\frac {x^{2}}{2}}\right).}

Hình ảnh bên phải cho thấy hàm mật độ xác suất cho phân phối chuẩn với các tham số khác nhau.

Một số tính chất với phân phối chuẩn:

  • Hàm mật độ là đối xứng qua giá trị trung bình (giá trị kì vọng).
  • Giá trị trung bình cũng là modetrung vị của nó.
  • 68.26894921371% của diện tích dưới đường cong là nằm trong khoảng 1 lần độ lệch chuẩn tính từ trị trung bình (tức là khoảng ( μ − σ ; μ + σ ) {\displaystyle (\mu -\sigma ;\mu +\sigma )} ).
  • 95.44997361036% của diện tích dưới đường cong là nằm trong khoảng 2 lần độ lệch chuẩn ( μ − 2 σ ; μ + 2 σ ) {\displaystyle (\mu -2\sigma ;\mu +2\sigma )} .
  • 99.73002039367% của diện tích dưới đường cong là nằm trong khoảng 3 lần độ lệch chuẩn ( μ − 3 σ ; μ + 3 σ ) {\displaystyle (\mu -3\sigma ;\mu +3\sigma )} .
  • 99.99366575163% của diện tích dưới đường cong là nằm trong khoảng 4 lần độ lệch chuẩn ( μ − 4 σ ; μ + 4 σ ) {\displaystyle (\mu -4\sigma ;\mu +4\sigma )} .
  • 99.99994266969% của diện tích dưới đường cong là nằm trong khoảng 5 lần độ lệch chuẩn ( μ − 5 σ ; μ + 5 σ ) {\displaystyle (\mu -5\sigma ;\mu +5\sigma )} .
  • 99.99999980268% của diện tích dưới đường cong là nằm trong khoảng 6 lần độ lệch chuẩn ( μ − 6 σ ; μ + 6 σ ) {\displaystyle (\mu -6\sigma ;\mu +6\sigma )} .
  • 99.99999999974% của diện tích dưới đường cong là nằm trong khoảng 7 lần độ lệch chuẩn ( μ − 7 σ ; μ + 7 σ ) {\displaystyle (\mu -7\sigma ;\mu +7\sigma )} .

Điểm uốn của đường cong xảy ra tại độ lệch chuẩn 1 tính từ trị trung bình.

Tích phân

Diện tích dưới đường cong phân phối chuẩn phải bằng 1. Tiếp theo là chứng minh:

Đặt I = ∫ − ∞ ∞ e − x 2 2 d x {\displaystyle I=\int \limits _{-\infty }^{\infty }e^{\frac {-x^{2}}{2}}dx} , Thì ta có I 2 = ( ∫ − ∞ ∞ e − x 2 2 d x ) ( ∫ − ∞ ∞ e − y 2 2 d y ) = ∫ − ∞ ∞ ∫ − ∞ ∞ e − x 2 + y 2 2 d x d y {\displaystyle I^{2}=(\int \limits _{-\infty }^{\infty }e^{\frac {-x^{2}}{2}}dx)(\int \limits _{-\infty }^{\infty }e^{\frac {-y^{2}}{2}}dy)=\int \limits _{-\infty }^{\infty }\int \limits _{-\infty }^{\infty }e^{-{\frac {x^{2}+y^{2}}{2}}}dxdy} .

để áp dùng biến đổi Hệ tọa độ cực, đặt x = r cos ⁡ θ , y = r sin ⁡ θ {\displaystyle x=r\cos \theta ,y=r\sin \theta } lại. Ta có [ d x d y ] = [ ∂ x ∂ r ∂ x ∂ θ ∂ y ∂ r ∂ y ∂ θ ] [ d r d θ ] = [ cos ⁡ θ − r sin ⁡ θ s i n θ r cos ⁡ θ ] [ d r d θ ] {\displaystyle {\begin{bmatrix}dx\\dy\end{bmatrix}}={\begin{bmatrix}{\frac {\partial x}{\partial r}}&{\frac {\partial x}{\partial \theta }}\\{\frac {\partial y}{\partial r}}&{\frac {\partial y}{\partial \theta }}\end{bmatrix}}{\begin{bmatrix}dr\\d\theta \end{bmatrix}}={\begin{bmatrix}\cos \theta &-r\sin \theta \\sin\theta &r\cos \theta \end{bmatrix}}{\begin{bmatrix}dr\\d\theta \end{bmatrix}}} với Ma trận Jacobi.

Định thức Jacobi J = [ ∂ ( x , y ) ∂ ( r , θ ) ] {\displaystyle J={\begin{bmatrix}{\frac {\partial (x,y)}{\partial (r,\theta )}}\end{bmatrix}}} , Ta có d x d y = [ ∂ x ∂ r ∂ x ∂ θ ∂ y ∂ r ∂ y ∂ θ ] d r d θ = r d r d θ {\displaystyle dxdy={\begin{bmatrix}{\frac {\partial x}{\partial r}}&{\frac {\partial x}{\partial \theta }}\\{\frac {\partial y}{\partial r}}&{\frac {\partial y}{\partial \theta }}\end{bmatrix}}drd\theta =rdrd\theta } . nên I 2 = ∫ − ∞ ∞ ∫ − ∞ ∞ e − x 2 + y 2 2 d x d y = ∫ 0 2 π ∫ 0 ∞ e − r 2 2 r d r d θ {\displaystyle I^{2}=\int \limits _{-\infty }^{\infty }\int \limits _{-\infty }^{\infty }e^{-{\frac {x^{2}+y^{2}}{2}}}dxdy=\int \limits _{0}^{2\pi }\int \limits _{0}^{\infty }e^{-{\frac {r^{2}}{2}}}rdrd\theta } .

Vậy I 2 = ∫ 0 2 π ∫ 0 ∞ e − r 2 r d r d θ = ∫ 0 2 π [ e − r 2 ] 0 ∞ d r d θ = ∫ 0 2 π 1 2 d θ = π {\displaystyle I^{2}=\int \limits _{0}^{2\pi }\int \limits _{0}^{\infty }e^{-r^{2}}rdrd\theta =\int \limits _{0}^{2\pi }[e^{-r^{2}}]_{0}^{\infty }drd\theta =\int \limits _{0}^{2\pi }{\frac {1}{2}}d\theta =\pi } , ta có I = π . {\displaystyle I={\sqrt {\pi }}.}

Hàm phân phối tích lũy

Hàm phân phối tích lũy tương ứng với các hàm mật độ ở trên

Hàm phân phối tích lũy (cdf) chính là xác suất để một biến X {\displaystyle X} có giá trị nhỏ hơn hay bằng x {\displaystyle x} , và nó được biểu diễn dưới dạng hàm mật độ sau:

F ( x ; μ , σ ) = 1 σ 2 π ∫ − ∞ x exp ⁡ ( − ( u − μ ) 2 2 σ 2   ) d u . {\displaystyle F(x;\mu ,\sigma )={\frac {1}{\sigma {\sqrt {2\pi }}}}\int _{-\infty }^{x}\exp \left(-{\frac {(u-\mu )^{2}}{2\sigma ^{2}}}\ \right)\,du.}

Hàm cdf chuẩn tắc, qui ước viết là Φ {\displaystyle \Phi } , chỉ là từ dạng cdf tổng quát và được tính với μ = 0 {\displaystyle \mu =0} và σ = 1 {\displaystyle \sigma =1} ,

Φ ( x ) = F ( x ; 0 , 1 ) = 1 2 π ∫ − ∞ x exp ⁡ ( − u 2 2 ) d u . {\displaystyle \Phi (x)=F(x;0,1)={\frac {1}{\sqrt {2\pi }}}\int _{-\infty }^{x}\exp \left(-{\frac {u^{2}}{2}}\right)\,du.}

Hàm cdf chuẩn hóa có thể được biểu diễn dưới dạng một hàm đặc biệt gọi là hàm sai số, như sau

Φ ( z ) = 1 2 [ 1 + erf ⁡ ( z 2 ) ] . {\displaystyle \Phi (z)={\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {z}{\sqrt {2}}}\right)\right].}

Hầm cdf nghịch đảo, hay hàm "quantile", có thể được biểu dưới dạng nghịch đảo của hàm sai số:

Φ − 1 ( p ) = 2 erf − 1 ⁡ ( 2 p − 1 ) . {\displaystyle \Phi ^{-1}(p)={\sqrt {2}}\;\operatorname {erf} ^{-1}\left(2p-1\right).}

Hàm "quantile" này đôi khi còn gọi là hàm "probit". Hàm "probit" không có nguyên hàm. Không có ở đây không phải là không tìm thấy, mà nghĩa là người ta chứng minh rằng không tồn tại một nguyên hàm như vậy

Giá trị của hàm Φ(x) có thể xấp xỉ một cách chính xác bằng nhiều phương pháp khác nhau, như tích phân số, chuỗi Taylor, hay chuỗi tiệm cận.

Hàm khởi tạo

Hàm khởi tạo Mômen

Hàm khởi tạo mômen được định nghĩa là giá trị kỳ vọng của exp ⁡ ( t X ) {\displaystyle \exp(tX)} .Với phân phối chuẩn, hàm được viết thành

M X ( t ) {\displaystyle M_{X}(t)\,} = E [ exp ⁡ ( t X ) ] {\displaystyle =\mathrm {E} \left[\exp(tX)\right]}
  = ∫ − ∞ ∞ 1 σ 2 π exp ⁡ ( − ( x − μ ) 2 2 σ 2 ) exp ⁡ ( t x ) d x {\displaystyle =\int _{-\infty }^{\infty }{\frac {1}{\sigma {\sqrt {2\pi }}}}\exp \left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right)\exp(tx)\,dx}
  = exp ⁡ ( μ t + σ 2 t 2 2 ) {\displaystyle =\exp \left(\mu t+{\frac {\sigma ^{2}t^{2}}{2}}\right)}

và có thể thấy bằng cách khai triển biểu thức trong ngoặc thành bình phương đúng.

Hàm đặc trưng

Hàm đặc trưng được định nghĩa là giá trị kì vọng của exp ⁡ ( i t X ) {\displaystyle \exp(itX)} , với i {\displaystyle i} là phần ảo đơn vị.Với phân phối chuẩn, hàm đặc trưng được viết thành

ϕ X ( t ; μ , σ ) {\displaystyle \phi _{X}(t;\mu ,\sigma )\!} = E [ exp ⁡ ( i t X ) ] {\displaystyle =\mathrm {E} \left[\exp(itX)\right]}
  = ∫ − ∞ ∞ 1 σ 2 π exp ⁡ ( − ( x − μ ) 2 2 σ 2 ) exp ⁡ ( i t x ) d x {\displaystyle =\int _{-\infty }^{\infty }{\frac {1}{\sigma {\sqrt {2\pi }}}}\exp \left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right)\exp(itx)\,dx}
  = exp ⁡ ( i μ t − σ 2 t 2 2 ) . {\displaystyle =\exp \left(i\mu t-{\frac {\sigma ^{2}t^{2}}{2}}\right).}

Hàm đặc trưng được tính bằng cách thay thế t {\displaystyle t} cho i t {\displaystyle it} trong hàm khởi tạo mômen.

Tài liệu tham khảo

WikiPedia: Phân phối chuẩn http://www.danielsoper.com/statcalc/calc02.aspx http://www.sixsigmafirst.com/proba.htm http://mathworld.wolfram.com/NormalDistribution.ht... http://www.elektro-energetika.cz/calculations/no.p... http://socr.stat.ucla.edu/htmls/SOCR_Distributions... http://www.visualstatistics.net/Statistics/Euler/E... http://www.visualstatistics.net/Statistics/Maxwell... http://web.archive.org/19990117033417/members.aol.... http://web.archive.org/19990508224238/members.aol.... http://web.archive.org/19990508225359/members.aol....